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摘 要 : [目的 /意义 ] 通 过 分 析 引 文 持续 增长 论文 的 表现 特征 和 深层 原因 ,揭示 论文 持续 影响 力 的 相关 规律 。[ 方 法 /过 
程 ] 选 择 美国 物理 学 会 (APS) 数 据 集 作 为 数据 源 ,借助 BASS 模型 识别 引文 持续 增长 型 论文 ,并 根据 1: 1 原则 选取 
引文 非 持续 增长 型 论文 作为 对 照 组 ,比较 两 组 论文 在 文献 特征 和 引文 扩散 网 络 上 的 差异 。[ 结果 /结论 ] 结果 表 
8] ,引文 持续 增长 论文 具有 特殊 的 文献 特征 和 扩散 特性 :长 标题 文献 较 多 ,单独 作者 和 两 人 合作 更 为 常见 ,对 前 人 
研究 依赖 程度 较 低 ;此 类 论文 引文 级 联网 络 内 部 有 着 更 多 的 模块 结构 ,在 较 短 代 际 距离 内 呈现 “广播 式 ” 扩散 


模式 。 
条 键 词 : 持续 增长 文献 特征 ”引文 扩散 ”网络 指 标 科 
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%B 成 果 重要 性 ,实用 性 , 受 关注 程度 以 及 学 术 影响 力 
的 全 要 指标 。 随 着 研究 深入 ,学 者 们 提出 了 更 多 的 科 


在 利用 引文 分 析 科 学 文献 学 术 影 响 力 时 ,学 者 们 
常 关注 被 引 频 次 在 时 间 维 度 下 的 变化 分 布 ”。 被 引 频 
次 的 时 间 序 列 构成 引文 曲线 ,也 即 引 文 轨迹 ,学 者 们 对 
科学 论文 的 引文 轨迹 进行 划分 ,得 到 了 不 同 的 划分 结 
果 ”“ 。 而 一 篇 文献 的 引文 曲线 模式 既 受到 文献 自身 
地 征 的 影响 ,还 会 因 施 引 者 施 引 行为 的 不 同 而 有 所 区 
分 ,这 些 不 同 带 来 的 影响 不 仅 可 以 呈现 在 引文 曲线 上 ，， 
也 反映 在 引文 扩散 网 络 和 引文 级 联结 构 上 。 

大 多 数 文 献 会 经 历 发 表 、 兴 盛 到 老化 .死亡 的 过 
程 , 此 为 文献 的 引文 生命 周期 。 伴 随 着 科学 发 展 速度 
变 快 , 有 学 者 提出 由 于 文献 数字 化 访问 和 搜索 服务 的 
改进 , 旧 文 献 被 发 现 和 利用 的 可 能 性 会 提高 ” ,文献 生 


命 周期 也 得 以 延长 。 笔 者 观察 经 典 引 文 曲 线 类 型 发 
现 ,论文 发 表 后 直到 开始 衰老 前 的 特定 时 间 段 内 ,曲线 
是 近乎 单调 增长 的 ,单调 增长 的 时 间 路 度 越 大 ,我们 认 
为 文献 受到 的 关注 和 肯定 程度 越 高 ,文献 生命 周期 跨 
度 也 更 长 。 而 如 果 一 篇 论文 自发 表 后 引文 曲线 呈 持 续 
增长 趋势 , 则 属于 引文 持续 增长 型 论文 。V. Cano 
等 “发 现 高 被 引 的 论文 存在 ALB. 两 种 生命 周期 类 
型 一 一 早期 崛起 型 和 稳定 增长 型 ,后 者 自 发 表 后 引文 
保持 稳定 增长 ,表现 出 恒定 的 活力 。 王 海燕 等 ”将 高 
被 引 论文 曲线 分 为 持续 增长 分 布 和 显 峰 型 分 布 两 种 ， 
其 中 持续 增长 分 布 曲线 由 于 提出 的 理论 或 方法 被 广泛 
认可 ,从 而 具备 持久 的 学 术 影响 力 。 

论文 的 持续 被 引 与 文献 的 内 容 质量 有 关 , 也 和 论 
文 的 外 在 特征 存在 联系 。 尽 管 引 文 持 续 增长 型 论文 已 
有 部 分 研究 提 及 ,但 是 其 深层 原因 和 表现 特征 有 符 进 
一 步 探 讨 。 笔 者 利用 BASS 模型 识别 出 引文 持续 增长 
型 论文 作为 实验 组 ,同时 选择 引文 非 持续 增长 论文 作 
为 对 照 组 ,借鉴 引文 增长 影响 因素 和 引文 扩散 网 络 研 
究 常 用 方法 ,分 析 两 组 论文 指标 特征 ,总 结 其 对 引文 持 
续 增长 的 影响 ;通过 比较 两 组 论文 引文 网 络 的 各 项 指 
标 ,探讨 引文 持续 增长 的 影响 因素 和 知识 扩散 特征 。 

本 文 的 研究 意义 在 于 通过 科学 研究 促进 对 引文 持 
续 增 长 型 论文 的 科学 认识 ,为 发 现 更 多 论文 引用 规律 、 
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提高 单 篇 论文 科学 影响 估 测 能 力 提供 借鉴 。 
2 文献 综述 


2.1 学 术 论 文 的 引文 扩散 研究 

基于 引文 分 析 科 学 论文 知识 扩散 研究 将 单 篇 文献 
视 为 基本 单元 ,根据 文献 引用 关系 进行 理论 研究 和 实 
证 总 结 来 分 析 知 识 的 产生 传播 和 创新 演化 过 程 。 国 
内 多 位 学 者 从 论文 的 引用 网 络 ” .引用 对 象 ” 以 及 引 
用 预测 ”等 不 同 角度 进行 梳理 ,认为 主流 研究 主题 包 
括 :扩散 测度 指标 构建 ,引文 扩散 网 络 及 路 径 识别 、 扩 
散 结构 和 机 理 等 ,具体 如 下 : 
2.1.1 引文 扩散 衡量 指标 

现 有 知识 扩散 衡量 指标 主要 从 速度 .广度 .强度 和 


深度 4 个 方面 进行 构建 。 在 引文 扩散 速度 方面 ,R. 
Roseau 借助 施 引 期 刊 数量 提出 文章 -期 刊 扩散 速度 


| 


average diffusion speed) J& fg" ,Y. Liu 等 根据 施 
PRELET SERE -学科 ADS 指标 。 论 文 知识 伟 
播 沫 度 也 体现 在 引文 累计 速度 上 ” 。 在 引文 扩散 广 
度 卜 ,学 者 们 主要 研究 施 引 论文 学 科 覆 盖 程 度 , 目 前 已 
IDT JDF( journal diffusion factor ) m GETHES RUM 
ABER, T. F. Frandsen 等 提出 可 以 将 研究 期 刊 扩散 特 
征 移 方法 应 用 于 单 篇 论文 知识 扩散 研 究 ,Y，Iin 
短语 在 JDF 等 基础 上 提出 FDB(field diffusion breadth) 
指 乏 , 用 以 表征 知识 扩散 的 广度 。 梁 国 强 等 中 则 引入 
炉 肖 概 念 来 测度 论文 影响 的 学 科 广 度 。 对 引文 扩散 强 
度 隐 研究 与 广度 紧密 相关 ,如 Y，Liu 等 "将 论文 的 施 
引 实 献 属于 特定 ESI 领域 的 数量 作为 其 在 该 EST 领域 
中 的 扩散 强度 FDI(field diffusion intensity) 。 而 引文 扩 
散 的 深度 往往 反映 在 论文 发 表 后 产生 的 引文 级 联 增长 
中 ,有 关 引 文 级 联 的 研究 有 助 于 从 微观 结构 上 观察 引 
文 扩散 "|。 
2.1.2 引文 扩散 网 络 

引文 网 络 相 关 工 作 主要 包括 网 络 测度 指标 设计 和 
网 络 主 路 径 识别 两 个 主题 。 在 网 络 测度 指标 设计 上 ， 
学 者 们 借鉴 了 图 论 、 复 杂 网 络 分 析 、 社 会 网 络 分 析 等 方 
法 ,构建 了 网 络 密度 .连通 性 .中 心性 .小 团体 、 特 征 路 
FRE . 聚 类 系数 等 指标 ,并 解释 其 在 引文 扩散 语 境 下 
的 含义 。 在 网 络 主 路 径 识别 上 ,学 者 董 克 EA N I] 
络 路 径 识 别 相关 研究 主要 集中 于 引文 学 科 知 识 扩 散 过 
程 .路 径 识别 .语义 分 析 和 拓扑 结构 拓展 4 方面 。 
近年 来 也 出 现 了 一 些 新 的 主题 ,如 有 学 者 根据 文献 直 
引 、 共 被 引 、 耦 合 关 系 构 建 三 维 引文 网 络 挖掘 知识 主题 
流动 特征 ,分 析 单 篇 文献 在 知识 网 络 中 的 扩散 


FREU, 
2.1.3 引文 扩散 模型 

科学 知识 扩散 模型 的 构建 多 借鉴 其 他 领域 的 成 熟 
模型 , 陈 柏 形 , 张 效 两 人 将 现 有 模型 划分 为 类 传染 病 模 
型 网络 生长 模型 和 基于 引文 的 过 程 模型 3 BRUT ,并 
对 SEIRZ SIR 等 经 典 的 模型 构建 过 程 进行 了 梳理 。 近 
年 来 ,学 者 们 尝试 改良 现 有 模型 或 引入 新 模型 去 分 析 
引文 扩散 机 理 , 如 工 Zhang 4&7" ,C. Min 等 ”进一步 
扩展 Bass 模型 在 引文 扩散 领域 中 的 研究 ,Z，He 等 借 
助 并 改进 WSB 模型 为 睡 美人 .二 次 爆发 等 非典 型 引文 
曲线 的 文献 构建 引文 模型 ,解释 其 引文 内 在 增长 机 
i S. Copiello 则 引入 空间 自 回归 模型 用 以 分 析 引 
行为 中 存在 的 同 群 效应 和 邻里 效应 2 。 
2.2 论文 引文 增长 影响 因素 研究 

学 术 论 文 被 引 频次 的 大 小 及 时 序 分 布 取决 于 众多 
影响 因素 ,国内 外 学 者 从 施 引 者 认 知 影响 ,文献 计量 学 
等 角度 出 发 开展 了 诸多 研究 。 以 施 引 者 认 知 影响 为 
例 ,早期 学 者 G. Nigel Gilbert 提出 了 施 引 者 引用 著名 
作者 的 文献 是 为 了 增强 自身 研究 可 信 度 的 可 能 性 ， 
现 有 研究 也 表明 ,作者 引用 一 篇 论文 的 动机 和 目的 是 
多 样 的 “| ,这 也 影响 着 引文 累积 的 过 程 。 而 从 文献 计 
量 学 角度 出 发 的 研究 主要 从 期 刊 , 作 者 、 学 科 以 及 文献 
自身 4 个 方面 分 析 , 主 要 采用 回归 分 析 、 相 关 性 分 析 以 
及 预测 模型 等 方法 。 
2.2.1 影响 因素 分 析 

现 有 研究 从 4 个 角度 进行 探讨 。 从 论文 作者 出 
发 ,研究 者 们 得 出 作者 的 数量 ”” 个 人 竞争 力 '” .名 
誉 声望 ”第 一 作者 指数 "以 及 作者 的 团队 合 
EP 等 因素 与 文章 的 引文 频次 存在 相关 关系 。 从 学 
科 出 发 ,有 学 者 以 单一 学 科 为 重点 研究 领域 ,探讨 学 科 
内 引文 影响 因素 ,如 P. Ball 和 L. Bormann 等 “分 
别 从 天 体 物 理学 领域 与 化 学 领域 分 析 了 引文 频次 影响 
因素 。 也 有 学 者 对 比 了 不 同学 科 领 域 ,如 李 长 玲 等 3 
研究 了 不 同学 科 下 论文 影响 力 在 各 评价 指标 上 的 特征 
差异 。 从 期 刊 出 发 ,有 学 者 论证 了 期 刊 影响 因子 可 以 
促进 文献 被 引用 , L. Bornmann 等 认为 期 刊 影响 因 
子 可 用 于 预测 论文 被 引 , 同 时 也 指出 论文 发 表 历史 较 
长 时 IF 预测 能 力 减 弱 ” 。 从 文献 自身 角度 出 发 的 研 
究 结 合 了 定性 和 定量 的 分 析 方 法 ,学 者 M. E. Falagas 
等 .中 和 P.，Ball' 发 现 文章 长 度 与 引用 呈现 正 相关 关 
系 ,T.，Liskiewicz 等 ”认为 论文 标题 长 度 和 目标 文献 
的 参考 文献 数量 对 引用 率 存在 积极 影响 ,国内 姜 窜 
等 中 则 提出 参考 文献 质量 对 被 引 的 影响 并 不 显著 。 
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论文 的 被 引 趋势 也 受到 上 述 多 种 因素 的 影响 ,只 
是 不 同 的 场景 下 ,各 因素 作用 强度 不 尽 相 同 。S. 
Wuchty 等 提出 随 着 时 间 推 移 , 团 队 合作 研究 成 果 获 得 
更 多 关注 的 优势 会 不 断 增加 ;J. Wang 等 的 研究 也 
证 实 参考 文献 的 学 科 多 样 性 和 差异 性 对 长 期 引用 有 着 
积极 影响 ,而 对 短期 引用 产生 负面 作用 ” 。 
2.2.2 研究 方法 选取 

研究 者 们 大 多 采用 回归 分 析 法 ,以 论文 被 引 频 次 
为 因 变量 ,提取 和 量化 影响 因素 指标 作为 自 变 量 进行 
实证 分 析 。 如 L. Bornmannn 借助 多 级 回归 模型 得 出 
归 一 化 论文 影响 力 (NCSs ) 与 作者 数量 .参考 文献 数 
ti ` 页 数 和 期 刊 影响 因子 关系 较 弱 的 结果 。 也 有 学 
者 采用 其 他 的 方法 ,如 S. Jiang 等 提出 了 一 个 多 维 网 
HAER ,借助 社会 资本 理论 探究 研究 人 员 的 协作 经 验 、 


Cepat] ARO) 


在 公式 (1) 中 ,f(t) 代 表 t 时 的 采纳 部 分 ,P(t) 为 
从 初始 到 t 时 的 采纳 部 分 ,4A() 为 t 时 的 累计 采用 者 数 
Eo pq M 分 别 为 创新 参数 、 模 仿 参 数 和 市 场 总 潜力 
(最 终 的 采用 数量 ) 。 

已 有 学 者 将 该 模型 引入 引文 分 析 研 究 ,其 中 C. 
Min 等 ”根据 Bass 模型 拟 合 得 到 的 参数 值 将 科学 论 
文 划 分 为 4 组 ,其 中 参数 p EA q 值 较 小 的 论文 年 度 
引文 量 呈 现 出 持续 增长 的 特征 ,这 部 分 论文 学 术 影 响 
力 和 未 来 潜在 的 科学 影响 都 较 高 。 笔 者 采用 同样 的 方 
法 识别 引文 持续 增长 型 论文 。 首 先 对 数据 集 进行 得 
选 ,选择 文献 类 型 为 "article” ,总 被 引 次 数 不 低 于 20, 
且 引 文 窗口 在 10 年 以 上 ,得 到 60 491 篇 论文 。 然 后 采 


Cm 


可 伪 度 和 职业 生涯 等 因素 对 知识 扩散 产生 的 正 向 

UN ` 
述评 

纵 观 国内 外 相关 研究 ,可 知 两 个 研究 领域 都 已 经 


较 六 成熟。 学 者 们 不 断 加 深 对 单 篇 论文 的 引文 扩散 特 


长 机 理 的 研究 ,尝试 构建 新 的 指标 .引入 更 多 模 
j 是 好 地 解释 引文 扩散 现象 ,同时 从 多 个 角度 考察 和 
探 政论 文 被 引 频次 及 其 累计 过 程 的 影响 因素 ,即使 不 
周 党 者 得 出 的 研究 结论 可 能 并 不 一 致 。 然 而 ,目前 对 
特定 一 类 引文 曲线 的 形成 原因 以 及 更 细致 的 引文 扩散 
犊 多 的 研究 较 少 ,也 鲜 有 研究 对 引文 持续 增长 型 论文 
的 古文 增长 影响 因素 和 知识 扩散 特征 进行 探索 , 故 笔 
者 引入 文 献 特 征 和 网 络 特征 相关 指标 ,采用 描述 性 统 
计 呐 配对 样本 非 参数 检验 方法 ,探讨 该 类 论文 的 一 般 
规律 与 特征 。 由 于 物理 学 最 能 代表 基础 研究 领域 , 笔 
者 将 其 作为 实证 领域 ,识别 出 该 领域 内 引文 呈现 持续 
增长 的 科学 论文 ,观察 这 部 分 论文 与 对 照 组 文献 相 比 
所 具备 的 文献 内 容 特征 和 形式 特征 以 及 在 引文 网 络 中 
的 异同 ,以 期 揭示 引文 持续 增长 论文 知识 扩散 的 一 般 
特征 及 其 影响 因素 。 


3 ”数据 和 方法 


3.1 数据 

研究 数据 源 于 美国 物理 学 会 (APS ) 数据 集 , 纳 入 
了 1893 -2013 年 间 的 文献 。 为 识别 引文 持续 增长 型 
论文 ,本 研究 将 Bass 模型 应 用 到 APS 数据 集 上 进行 拟 
Ao WAWE F. M. Bass" 对 创新 扩散 理论 的 创新 
机 制 和 模仿 机 制 的 量化 建 模 ,是 分 析 创 新 产品 或 技术 
扩散 过 程 的 常用 经 典 模型 。Bass 数学 建 模 原 理 如 下 : 


非 线 性 最 小 二 乘法 (NLS ) 检验 拟 合 结果 ,提取 所 有 
非 负 参 数值 和 R^ 20.5 的 论文 共计 8 243 篇 。 最 后 将 
p 值 和 q 值 均 小 于 其 十 分 位 数 的 186 篇 论文 作为 实验 
组 论文 。 

为 了 更 好 地 对 比分 析 , 参 照 已 有 研究 ”按照 1:1 
的 比例 建立 对 照 组 :对 实验 组 中 每 一 篇 论文 ,选取 与 该 
论文 同年 发 表 在 同一 期 刊 上 且 总 被 引 量 相近 的 论文 放 
人 对 照 组 ,最 终 获取 186 篇 非 引 文 持续 增长 型 论文 。 
为 了 更 好 说 明 两 组 论文 的 区 别 , 从 实验 组 和 对 照 组 中 
各 选 两 篇 示例 论文 绘制 引文 曲线 见 图 1。 

3.2 分析 指标 构建 

为 了 对 比 两 组 论文 被 引 影响 因素 和 引文 扩散 特 
征 ,笔者 对 每 篇 论文 均 获 取 和 计算 其 文献 特征 和 引文 
网 络 两 方面 的 特征 ,分 别 选 取 指 标 如 表 1 所 示 。 所 有 
指标 均 用 于 对 比 实验 组 和 对 照 组 论文 的 特征 差异 , 限 
于 研究 重点 而 未 作 指 标 内 在 逻辑 关联 的 探讨 。 

(1) 文 献 特征 。 选 取 论 文 标题 长 度 、 作 者 人 数论 
文 篇 幅 、 参 考 文献 数量 与 普 赖 斯 指数 5 个 指标 作为 文 
献 特 征 ,这 些 指标 是 从 常用 指标 以 及 之 前 一 些 已 经 证 
实 与 论文 被 引 存在 正 相 关 关 系 的 研究 工作 “-” 中 收 
集 的 。 

(2) 网络 特征 。 引 文 扩散 研究 包含 科学 论文 施 引 
过 程 的 动态 研究 ,笔者 选择 科学 文献 发 表 后 的 四 代 施 
引 论文 构建 引文 级 联网 络 ,对 网 络 密度 .平均 聚集 系 
数 .最 长 路 径 长 度 这 3 个 常用 于 刻画 网 络 结构 的 指标 
进行 计算 来 测度 引文 扩散 的 动态 特征 。 

为 了 衡量 文献 的 新 颖 性 和 创造 性 ,笔者 采纳 了 基 
于 论文 参考 文献 和 施 引 文献 来 测度 其 科学 颠覆 性 的 D 
指数 (Disruption index) fif ^ ， 即 引用 目标 文献 而 没 
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b 对 照 组 RIM 


1 两 组 引文 曲线 示例 


= 表 1 指标 对 比 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


Aire 具体 指标 定义 及 计算 
dei 论文 标题 长 度 论文 标题 所 含 单词 个 数 
CO 论文 篇 幅 论文 页 数 
加 作者 人 数 论文 合作 者 数量 
参考 文献 数量 参考 文献 篇 数 
ST aene 参考 文献 的 知识 新 近 程度 
MAE ”网络 密度 。 ”网 络 中 实际 存在 的 边 数 与 可 容纳 的 边 数 上 
21E| 
= 限 的 比值 D = MaA- 
N 平均 聚集 系数 。 全 局 聚集 系数 用 于 度量 整个 网 络 的 集聚 性 
~ Cyr ZCO) 
S< 最 长 路 径 长 度 。 针对 引文 级 联 有 向 无 环 图 求 其 关键 路 径 的 
e 长 度 
创新 性 科学 文献 的 知识 颠覆 性 强度 


-一 有 引用 其 参考 文献 的 施 引 文献 数量 与 同时 引用 目 


标 刀 页 及 其 参考 文献 之 一 的 施 引 文献 数量 与 目标 文献 
及 其 参考 文献 所 有 施 引 文献 之 和 的 比例 。 简 单 来 说 ， 
该 指数 越 大 ,文献 的 颠覆 性 越 强 。D 指数 计算 方式 
如 下 : 


N, - N! 

其 中 ,N; 为 引用 目标 文献 但 未 引用 其 参考 文献 的 
施 引 文献 数量 ,Ni 为 引用 了 目标 文献 的 同时 至 少 引用 
了 1 篇 其 参考 文献 的 施 引文 献 数量 ,N 为 没有 引用 目 
标 文献 ,但 至 少 引 用 了 1 篇 目标 文献 参考 文献 的 文献 


DI, 公式 (2) 


笔者 借助 KS - 检验 分 析 所 有 指标 数据 是 否 服从 
正 态 分 布 ,结果 了 值 均 大 于 0.05 ,拒绝 了 这 一 假设 ， 


此 可 以 采用 威 尔 克 森 符号 秩 检验 (Wileoxon signed-rank 
test) 比较 两 组 数据 的 区 别 。 该 方法 是 对 非 参 数 统计 中 
符号 检验 法 的 改进 ,适用 于 总 体 数据 不 服从 正 态 分 布 
且 分 布 情况 不 明 的 情况 ,可 被 用 来 检验 数据 资料 是 否 
来 自 同一 个 总 体 的 假设 。 为 进一步 对 比 和 了 解 两 组 论 
文 在 具有 显著 差异 的 指标 上 的 特征 ,笔者 先进 行 统计 
检验 ,根据 检验 结果 针对 具体 指标 进行 可 视 化 展示 和 
分 析 。 
4.1 文献 特征 指标 

表 2 与 表 3 分 别 为 两 组 论文 文献 特征 指标 的 检验 
结果 和 描述 统计 。 数 据 表明 ,两 组 论文 在 论文 篇 幅 上 
不 存在 显著 差异 (p 值 0.144 5 > 0. 05 ) ,但 在 标题 长 
度 、 作 者 人 数 、 参 考 文献 数量 、 普 赖 斯 指数 指标 上 存在 
差异 ,图 2 即 为 实验 组 与 对 照 组 在 文献 特征 指标 上 的 


对 比 示意 图 。 

表 2 文献 特征 指标 的 威 尔 克 森 符号 秩 检验 结果 

特征 BER 检验 结果 

文献 特征 论文 标题 长 度 0.030 5* 

论文 篇 幅 0.144 5 
作者 人 数 0.000 1 *** 

参考 文献 数量 0.028 6* 
普 赖 斯 指数 0.007 6 ** 


注 :* 表 示 Sig. fH «0.05 , XR Sig. (H «0.01, *x* 表 示 Sig. fH 
«0.001 


AR 


结合 图 2 可 以 看 出 ,两 组 论文 标题 长 度 主 要 集中 
在 [4, 13] 区 间 内 ,引文 持续 增长 论文 的 标题 长 度 均 
值 略 高 于 非 持 续 增 长 论文 ,观察 数值 分 布 可 以 发 现 , 当 
标题 中 单词 个 数 超过 8 个 时 ,实验 组 论文 数量 较 对 照 
组 更 多 ,表明 实验 组 中 长 标题 论文 更 多 ;而 引文 非 持续 
增长 的 论文 标题 长 度 更 集中 分 布 在 [5 ,9 ] 内 。 
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表 3 两 组 论文 文献 特征 指标 的 描述 性 统计 结果 


e 论文 标题 长 度 论文 篇 幅 作者 人 数 参考 文献 数量 普 赖 斯 指数 
iiie: 实验 组 对 照 组 实验 组 对 照 组 实验 组 实验 组 实验 组 对 照 组 实验 组 对 照 组 
平均 值 8. 833 8.161 12.651 12. 731 2.038 2.887 17.554 17.317 0.587 0. 690 
标准 差 3.766 3.378 21.039 14. 725 1.122 3.590 47.681 22.201 0.311 0. 267 
最 小 值 2 2 1 1 1 1 0 0 0 0 
最 大 值 22 24 224 95 7 34 582 165 1 1 

25% 6 6 3 3.25 1 1 4 6 0.377 0. 500 
5096 8 8 8 8.5 2 2 7 11 0.615 0.735 
75% 11 10 14 15 2 3 16 19 0. 833 0.912 
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2 实验 组 和 对 照 组 文献 特征 指标 分 布 统计 


在 论文 作者 人 数 方面 ,两 组 论文 存在 显著 差异 (p 
值 0.000 1 <0.001) 。 对 照 组 论文 均值 为 2. 038 ,小 于 
实验 组 论文 合作 者 数量 均值 2. 887 ,也 就 是 说 ,引文 非 
持续 增长 论文 篇 均 作者 人 数 平均 比 引文 持续 增长 论文 
作者 约 多 1 人 。 此 外 ,实验 组 论文 作者 数量 标准 差 远 
小 于 对 照 组 ,分布 也 远 比 对 照 组 更 集中 。 

在 论文 参考 文献 数量 方面 ,尽管 实验 组 和 对 照 组 
受 极 值 影响 ,篇 均 参 考 文献 数量 差距 非常 小 ,但 检验 结 
果 表 明 二 者 仍 存在 明显 差异 。 从 图 2 可 以 看 出 ,两 组 
论文 均 呈 现 参考 文献 数量 越 大 论文 数量 越 少 的 趋势 。 
实验 组 参考 文献 主要 分 布 在 (0,10]、[10,20] 区 间 内 ， 
而 对 照 组 论文 在 参考 文献 数量 较 多 的 区 间 内 论文 数量 


在 论文 普 赖 斯 指数 特征 方面 ,两 组 论文 也 存在 明 
TÆ (p 值 0.007 6 <0.01)。 观 察 图 2 可 以 看 出 , 实 
验 组 普 赖 斯 指数 在 大 部 分 区 间 内 分 布 较为 均匀 ,对 照 
组 则 主要 分 布 在 [0.6,1] 高 值 区 间 内 。 对 照 组 论文 普 
赖 斯 指数 均值 高 于 实验 组 论文 均值 ,也 就 是 说 ,引文 持 
续 增 长 型 论文 比 引文 非 持续 增长 论文 平均 被 引 半 衰 期 
更 长 ,文献 老化 速度 更 慢 。 

4.2 网 络 特征 指标 

表 4 和 表 5 分 别 为 两 组 论文 扩散 网 络 指标 的 检验 
结果 和 描述 统计 。 数 据 表明 ,两 组 论文 在 网 络 密度 上 
不 存在 显著 差异 (p 值 0.107 8 20.05) ,在 平均 聚集 系 
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表 4 网 络 特征 指标 的 威 尔 克 森 符号 秩 检验 结果 
特征 指标 检验 结果 
网 络 特征 网 络 密度 0.107 8 
平均 聚集 系数 0.000 1 *** 
最 长 路 径 长 度 0.0323* 
Dindex(1) 0.000 0 *** 


IE: * 表 示 Sig. 值 <0.05 ，*s#x 表 示 Sig. {É «0. 001 


数 .最 长 路 径 长 度 .D 指数 指标 上 存在 差异 。 图 3 即 为 


实验 组 与 对 照 组 在 网 络 特征 指标 上 的 对 比 示 意图 。 

在 平均 聚集 系数 方面 ,两 组 论文 存在 非常 显著 的 
差异 。 对 照 组 论文 篇 均 平 均 聚 集 系 数 为 0.149 ICT SC 
验 组 。 对 照 组 论文 平均 聚集 系数 高 度 集 中 于 (0. 1， 
0.2) 区 间 内 ,而 实验 组 论文 平均 系数 分 布 则 相对 离散 ， 
这 说 明 引 文 持 续 增 长 论文 引文 网 络 呈 现 互 锁 式 可 能 ' 


更 高 。 


表 S 两 组 论文 引文 扩散 网 络 特征 指标 的 描述 统计 结果 
网 络 密度 平均 聚集 系数 最 长 路 径 长 度 Dindexl 

统计 量 

实验 组 对 照 组 实验 组 对 照 组 实验 组 对 照 组 实验 组 对 照 组 
平均 值 0.004 0. 003 0.170 0. 149 20.532 18.930 0. 197 0. 107 
标准 差 0. 005 0.004 0.061 0.058 8.397 7.067 0.341 0.274 
dO 0. 000 0. 000 0. 030 0.037 5 6 -0.338 -0.242 

T 0. 028 0. 040 0. 435 0. 461 52 40 1.0 1.0 

0. 001 0. 001 0. 128 0.111 14 14 -0.023 -0.036 

0. 002 0.001 0.164 0.142 20 18 0. 049 0. 002 

0. 004 0. 003 0. 207 0. 180 25 22 0. 324 0. 145 


coy (E ERI ioc HERE 77 Vil , WI SEDE CULTE TE SE 


差 蜀 。 实 验 组 论文 均值 为 20.532 ,高 于 对 照 组 论文 长 


C 


RETIE 18. 930 ,与 引文 非 持 续 增长 论文 相 比 , 引 文 持续 
下 型 论文 往往 扩散 路 径 更 长 ,网 络 更 为 复杂 。 
USS P. Azoulay "Xf L. Wu 等 "提出 的 DD 指数 
Wl A SLT AEREN URS FRE RE cS n ic 
ug T VIC Ae HAKSAL, MAALAT 
以 县 视 为 驳回 了 其 所 属 科学 领域 ;反之 ,文章 可 以 被 视 
为 皱 环 其 领域 ,对 该 领域 或 研究 传统 造成 “破坏 性 "或 
颠覆 性 的 改变 。 而 那些 推翻 婚 定 思维 范式 和 开辟 新 科 
学 流向 的 研究 对 科学 的 进步 发 展 是 至 关 重 要 的 。 笔 者 
计算 了 DI, ,检验 结果 表明 ,实验 组 和 对 照 组 论文 的 D 
指数 存在 非常 显著 的 差异 (p 值 0. 000 2 <0. 000 1), 
从 表 5 和 图 3 可 以 看 出 ,总 体 上 实验 组 D 指数 高 于 对 
照 组 ,在 0.3 -0.8 这 部 分 高 值 区 间 内 论文 数量 较 多 ， 
分 布 也 更 为 分 散 。 而 对 照 组 主要 分 布 在 [ -0.1,0.1] 
之 间 ,总 体 分 布 更 为 集中 。 
5 讨论 

文献 引证 使 得 蕴含 在 科学 工作 中 的 研究 发 现 可 以 
被 吸收 ,传承 和 改进 ,一 篇 具有 创造 性 .开拓 性 、 变 革 性 
的 论文 通常 在 其 发 表 后 会 不 断 被 学 者 们 肯定 和 关注 ， 
持续 激发 潜在 的 学 术 研 究 。 这 类 论文 或 是 采用 复杂 精 


妙 的 研究 方法 解决 某 个 特定 研究 问题 ,或 是 推翻 既定 
理论 开 尽 新 的 研究 视角 ,又 或 是 创造 了 某 种 新 的 研究 
工具 或 方法 等 ,使 得 其 施 引 量 呈 持续 增长 趋势 。 从 科 
学 政策 视角 看 ,我 们 关注 科学 价值 评估 和 高 质量 研究 
早期 识别 都 是 为 了 激励 和 促进 更 多 具有 新 突 性 和 革命 
性 的 科学 研究 诞生 ,最 大 化 研究 的 投入 产 出 结果 。 
此 了 解 什么 样 的 科学 研究 具有 长 期 的 ,持续 的 影响 力 
及 其 知识 传播 的 静态 分 布 和 动态 演变 都 是 非常 有 价 
值 的 。 

笔者 以 APS 数据 集 为 基础 ,根据 BASS 模型 识别 
引文 持续 增长 型 论文 ,并 按照 1: 1 原则 组 配对 照 组 ,在 
数据 确定 和 获取 的 过 程 考虑 了 时 间 窗 口 和 学 科 差 异 等 
因素 带 来 的 差异 ,增强 数据 的 可 对 比 性 。 研 究 结果 证 
实 ,引文 持续 增长 型 论文 具有 特殊 的 文献 特征 和 扩散 
特性 。 

文献 特征 方面 ,在 论文 标题 长 度 上 ,标题 作为 科学 
研究 工作 的 简短 概括 ,侧面 反映 研究 的 复杂 程度 和 深 
入 程度 ,因此 长 标题 往往 能 传达 更 丰富 的 信息 ,当然 也 
可 能 是 由 于 长 标题 包含 更 多 的 关键 词汇 ,被 检索 使 用 
的 可 能 性 提高 ,实验 组 的 长 标题 文献 相对 较 多 ,在 一 定 
程度 上 说 明 长 标题 论文 更 容易 激发 持续 引用 。 学 者 S. 
Wuchty 认为 ,团队 研究 通常 比 个 人 研究 能 够 获得 更 高 的 
被 引 频次 ,并且 这 种 优势 随 着 时 间 的 推移 而 增加 , 
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人 
的 团队 更 可 能 产 出 具有 高 影响 力 的 论文 5 ,本 文 
的 对 比 结果 相对 更 支持 后 一 种 观点 。 引 文 持续 增长 的 
单 旦 论文 作者 人 数 往往 较 少 也 因此 可 以 得 到 解释 : 作 
者 基数 较 少 的 论文 可 能 倾向 于 提出 新 的 理念 和 思想 ， 
跳 咎 现 有 的 科学 技术 思维 开启 新 的 研究 点 ,是 潜在 的 
高 质量 研究 ,而 大 团队 受 集体 声誉 和 主流 研究 想法 影 
响 , 往 往 在 发 表 初期 能 收获 大 量 引 文 , 但 后 续 引 用 逐渐 
疲软 ,因此 没有 成 为 引文 持续 增长 型 论文 。 

论文 篇 幅 在 实验 组 和 对 照 组 中 并 没有 显著 差异 ， 
表明 文章 长 度 对 文章 持续 积累 引文 能 力 的 区 分 并 不 明 
显 。 参 考 文献 是 科学 论文 的 重要 组 成 部 分 ,反映 了 研 
究 者 前 期 工作 的 深度 和 广度 ,阅读 吸收 文献 是 创新 工 
作 的 基础 和 前 提 , 因 此 参考 文献 的 数量 和 新 颖 程度 也 
是 影响 文献 被 引 的 因素 。 两 组 论文 对 比 结果 说 明 引文 
持续 增长 型 论文 对 领域 内 前 人 研究 依赖 程度 并 不 高 ， 
更 多 建立 在 比较 老 旧 .不 太 被 关注 的 研究 基础 上 ,因而 
即使 学 者 依据 当下 比较 多 .比较 新 的 文献 ,其 至 是 立足 
研究 热点 撰写 的 论文 ,也 不 一 定 能 够 保持 持续 被 引 的 
能 力 。 过 去 普遍 认为 随 着 科学 发 展 速度 加 快 ,科学 文 
献 过 时 速度 也 会 更 快 ,然而 旧 文 献 的 价值 也 会 随 着 网 


论文 数量 


(25,30] 
最 长 路 径 长 度 


B035] (35,40] (40,45] (45.50 (50,55] 


图 3 实验 组 和 对 照 组 网 络 指标 分 布 统计 


络 开放 获取 改进 数字 化 存储 和 搜索 引擎 发 展 而 被 研 
究 人 员 进 一 步 挖 据 。 研 究 表明 ,文献 要 想 产 生 持 续 影 
响 力 ,在 重视 创新 性 的 同时 也 可 以 适当 挖掘 利用 早期 
研究 文献 内 容 。 

在 网 络 特征 方面 ,引文 扩散 网 络 反映 了 知识 的 扩 
散 路 径 , 也 体现 了 知识 继承 、 创 新 的 过 程 。 引 文 持续 增 
长 型 论文 的 影响 扩散 特征 也 体现 在 其 引用 网 络 指标 
中 。 以 往 研 究 提 到 ,平均 聚集 系数 值 越 大 ,网 络 呈 现 互 
锁 式 可 能 性 越 高 ,反之 , 则 越 可 能 是 辐射 式 网 络 ” 。 
引文 持续 增长 型 论文 往往 内 部 有 着 更 多 的 模块 结构 ， 
不 同 节点 之 间 平 均 距 离 也 更 小 ,相互 联系 是 紧密 的 。 
结合 两 组 论文 引证 网 络 中 最 长 路 径 长 度 的 比较 ,笔者 
认为 引文 持续 增长 型 文献 能 够 在 较 短 的 代 际 距离 内 呈 
现 “ 广 播 式 ”扩散 ,同时 这 种 影响 是 深远 的 ,存在 知识 
的 不 断 流动 和 延续 。 

引文 持续 增长 型 论文 与 引文 非 持 续 增长 型 论文 之 
间 的 内 在 区 别 还 体现 在 对 所 属 学 科 领 域 的 “破坏 性 ” 
程度 (D 指数 ) 上 ,与 一 般 科学 论文 相 比 ,引证 了 引文 持 
续 增 长 型 论文 的 研究 同时 引证 其 参考 文献 的 可 能 性 更 
低 , 说 明 该 类 论文 成 为 后 续 研 究 的 直接 知识 来 源 , 被 广 
泛 接受 和 引用 ,即使 这 些 研 究 产生 的 影响 力 比较 滞后 ， 
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在 发 表 后 初期 只 收 到 了 小 部 分 的 引文 和 关注 ,但 之 后 
科学 价值 会 不 断 被 认可 。 


6 结语 


笔者 结合 文献 计量 部 分 指标 与 引文 扩散 相关 理 
论 , 以 物理 学 领域 为 实证 领域 ,比较 引文 持续 增长 型 论 
文 和 引文 非 持续 增长 型 论文 在 文献 特征 和 扩散 网 络 特 
征 两 方面 的 表现 和 特性 ,分 析 影 响 论文 持续 吸引 引用 
的 影响 因素 和 知识 扩散 模式 特征 。 研 究 得 出 如 下 结 
论 :WD 引文 持续 增长 型 论文 往往 论文 标题 较 长 ,单独 作 
者 和 两 人 合作 更 为 常见 ,对 前 人 研究 依赖 程度 较 低 ,更 
多 参考 比较 老 旧 .不 太 被 关注 的 研究 文献 ,同时 具备 这 
些 特征 的 文献 相对 来 说 更 能 吸引 引用 ;引文 持续 增 
才 型 论文 科学 颠覆 性 较 强 ,其 引文 级 联网 络 内 部 有 着 
本 多 的 模块 结构 ,能 够 在 较 短 代 际 距 离 内 呈现 “广播 
SED 散 模式 ,对 未 来 研究 产生 广泛 而 深远 的 影响 。 
3 随 着 更 多 评估 科学 价值 的 方法 兴起 ,论文 持续 影 
响 53 的 重要 性 也 将 更 加 关键 。 引 文 持续 增长 论文 的 特 
性 条 仅 在 文献 计量 指标 上 有 所 预示 ,也 反映 在 引用 行 
闫 寞 式 中 ,这 既是 引文 持续 增长 论文 区 别 于 一 般 论文 
的 桶 志 , 也 在 一 定 程度 上 揭示 了 其 形成 和 扩散 的 成 因 
旬刊 ， 笔 者 对 这 一 类 引文 遇 线 的 细致 研究 ,希望 能 给 
学 者 们 提高 自身 研究 成 果 持 续 影响 力 带 来 启示 ,为 科 
学 实 献 内 容 质量 早期 评估 和 潜在 科学 价值 客观 指标 构 
建 篇 相关 研究 提供 参考 ,同时 也 服务 于 变革 性 研究 的 
HERE 
3 己 本 研究 对 引文 持续 增长 论文 的 分 析 仅 是 对 这 类 论 
文 特征 的 初步 探索 ,存在 一 定 的 局 限 性 :个 缺乏 对 引用 
内 容 的 关注 ,未 来 可 以 采用 主题 分 析 等 方法 研究 目标 
文献 在 施 引 文献 中 的 价值 体现 方式 ,借助 回归 分 析 等 
理论 深入 研究 论文 引文 持续 增长 的 具体 原因 和 动力 ; 
@@ 研 究 以 物理 学 为 实证 领域 ,但 实际 上 学 科 差 异 和 选 
择 的 数据 集 均 可 能 导致 研究 结果 存在 区 别 , 引 文 持续 
增长 型 论文 在 不 同学 科 和 不 同 数据 集中 的 特征 表现 仍 
值得 进一步 探索 。 此 外 ,关于 是 否 可 以 在 发 表 初 期 就 
预测 单 篇 论文 的 持续 影响 力 ,确定 论文 得 以 持续 激发 
后 续 研 究 的 原因 有 哪些 以 及 如 何 测度 论文 的 潜在 持续 
影响 力 等 问题 ,都 有 待 今后 更 深入 的 研究 。 
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Research on the Features and Influencing Factors of Papers with Continuous Citation Growth 
He Jiejun Min Chao 
School of Information Management, Nanjing University, Nanjing 210023 

Abstract: | Purpose/Significance | This paper reveals the relevant laws of the continuous influence of papers by 
analyzing the performance characteristics and deep reasons of papers with continuous citation growth. | Method/ 
Process | This study chose the American Physical Society ( APS) as the data set, used the BASS model to identify 
papers with continuous citation growth, and papers with non-continuous citation growth were selected as the control 
group according to the 1:1 principle. The two groups of papers were compared in terms of literature characteristics 
and citation diffusion networks to get differences. | Result/Conclusion | The results show that, papers with continu- 
ous citation growth have special literature characteristics and diffusion characteristics: long-titlled papers are more, 
solo authors and two-person collaborations are more common , and reliance on previous research is less; and these pa- 
pers have more modular structures within citation cascade networks, presenting a "broadcast" diffusion pattern over 

*shorter intergenerational distances. 
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